Seatunnel Doris Sink

您所在的位置:网站首页 飞书failed to load ddl Seatunnel Doris Sink

Seatunnel Doris Sink

2024-07-09 05:52:14| 来源: 网络整理| 查看: 265

Seatunnel Doris Sink

SeaTunnel 是一个非常简单易用的超高性能分布式数据集成平台,支持海量数据的实时同步。每天稳定高效地同步数百亿数据

Connector-V2​

2.3.1 版本的 Apache SeaTunnel Connector-V2 支持了 Doris Sink,并且支持 exactly-once 的精准一次写入和 CDC 数据同步

插件代码​

SeaTunnel Doris Sink 插件代码

参数列表​nametyperequireddefault valuefenodesstringyes-usernamestringyes-passwordstringyes-table.identifierstringyes-sink.label-prefixstringyes-sink.enable-2pcboolnotruesink.enable-deleteboolnofalsedoris.configmapyes-

fenodes [string]

Doris 集群 FE 节点地址,格式为 "fe_ip:fe_http_port,..."

username [string]

Doris 用户名

password [string]

Doris 用户密码

table.identifier [string]

Doris 表名称,格式为 DBName.TableName

sink.label-prefix [string]

Stream Load 导入使用的标签前缀。在 2pc 场景下,需要全局唯一性来保证 SeaTunnel 的 EOS 语义

sink.enable-2pc [bool]

是否启用两阶段提交 (2pc),默认为 true,以确保 exact - once 语义。关于两阶段提交,请参考这里

sink.enable-delete [bool]

是否启用删除。该选项需要 Doris 表开启批量删除功能 (默认开启 0.15+ 版本),且只支持 Unique 表模型。你可以在这个链接获得更多细节:

批量删除

doris.config [map]

Stream Load data_desc 的参数,你可以在这个链接获得更多细节:

更多 Stream Load 参数

使用示例​

使用 JSON 格式导入数据

sink { Doris { fenodes = "doris_fe:8030" username = root password = "" table.identifier = "test.table_sink" sink.enable-2pc = "true" sink.label-prefix = "test_json" doris.config = { format="json" read_json_by_line="true" } }}

使用 CSV 格式导入数据

sink { Doris { fenodes = "doris_fe:8030" username = root password = "" table.identifier = "test.table_sink" sink.enable-2pc = "true" sink.label-prefix = "test_csv" doris.config = { format = "csv" column_separator = "," line_delimiter = "\n" } }}Connector-V1​

2.1.0 的 Apache SeaTunnel 支持 Doris 的连接器,SeaTunnel 可以通过 Spark 引擎和 Flink 引擎同步数据至 Doris 中。

Flink Doris Sink​

插件代码

Seatunnel Flink Sink Doris 插件代码

参数列表

配置项类型必填默认值支持引擎fenodesstringyes-Flinkdatabasestringyes-Flinktablestringyes-Flinkuserstringyes-Flinkpasswordstringyes-Flinkbatch_sizeintno100Flinkintervalintno1000Flinkmax_retriesintno1Flinkdoris.*-no-Flink

fenodes [string]

Doris Fe Http 访问地址,eg: 127.0.01:8030

database [string]

写入 Doris 的库名

table [string]

写入 Doris 的表名

user [string]

Doris 访问用户

password [string]

Doris 访问用户密码

batch_size [int]

单次写 Doris 的最大行数,默认值 100

interval [int]

flush 间隔时间 (毫秒),超过该时间后异步线程将 缓存中数据写入 Doris。设置为 0 表示关闭定期写入。

max_retries [int]

写 Doris 失败之后的重试次数

doris.* [string]

Stream load 的导入参数。例如:'doris.column_separator' = ', '等

更多 Stream Load 参数配置

Examples

Socket 数据写入 Doris

env { execution.parallelism = 1}source { SocketStream { host = 127.0.0.1 port = 9999 result_table_name = "socket" field_name = "info" }}transform {}sink { DorisSink { fenodes = "127.0.0.1:8030" user = root password = 123456 database = test table = test_tbl batch_size = 5 max_retries = 1 interval = 5000 }}

启动命令

sh bin/start-seatunnel-flink.sh --config config/flink.streaming.confSpark Sink Doris​

插件代码

Spark Sink Doris 的插件代码在这里

参数列表

参数名参数类型是否必要默认值引擎类型fenodesstringyes-Sparkdatabasestringyes-Sparktablestringyes-Sparkuserstringyes-Sparkpasswordstringyes-Sparkbatch_sizeintyes100Sparkdoris.*stringno-Spark

fenodes [string]

Doris Fe 节点地址:8030

database [string]

写入 Doris 的库名

table [string]

写入 Doris 的表名

user [string]

Doris 访问用户

password [string]

Doris 访问用户密码

batch_size [string]

Spark 通过 Stream Load 方式写入,每个批次提交条数

doris. [string]

Stream Load 方式写入的 Http 参数优化,在官网参数前加上'Doris.'前缀

更多 Stream Load 参数配置

Examples

Hive 迁移数据至 Doris

env{ spark.app.name = "hive2doris-template"}spark { spark.sql.catalogImplementation = "hive"}source { hive { preSql = "select * from tmp.test" result_table_name = "test" }}transform {}sink {Console { }Doris { fenodes="xxxx:8030" database="tmp" table="test" user="root" password="root" batch_size=1000 doris.column_separator="\t" doris.columns="date_key,date_value,day_in_year,day_in_month" }}

启动命令

sh bin/start-waterdrop-spark.sh --master local[4] --deploy-mode client --config ./config/spark.conf


【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭